Agent^2 RL-Bench: ¿Pueden los agentes LLM diseñar el post-entrenamiento de RL agentivo? Descubre si los agentes LLM pueden diseñar el post-entrenamiento de RL agéntico. Una exploración sobre inteligencia artificial autónoma. 2026-05-14 · 3 min